关联分析

要根据事务确认k-频繁项集扫好多次DB,效率太低了!怎么办?怎么加速?

找强关联规则

找频繁项集

构造哈希树:选择散列函数(理论上取啥都可以,不过最好取3)

支持度计算:传入事务,不断散列,散列到基层使用对比确认每个频繁项集的支持度